写在前面:标准版最长支持60秒语音文件,大于60秒的音频文件,需要进行切割后,然后依次提交即可。
切割音频工具:
开源VAD音频切分工具
https://ai.baidu.com/ai-doc/SPEECH/xk38lxq46
ffmpeg模块
以下所有的操作均是在windows系统,Python3下实现的;
百度短语音识别介绍:https://ai.baidu.com/ai-doc/SPEECH/Vk38lxily
登录百度AI平台,建立创建应用:
URL=https://console.bce.baidu.com/ai/?fromai=1#/ai/speech/app/list
切记,接口选择:语音技术,建议全部勾选,一般默认是全部勾选的,按照页面的要求填写,即可
应用建立成功之后一定要记录以下几个参数的值,APP_ID